package cn.xdf.learn.leetcode.滑动窗口;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class 重复的DNA序列{





    /**
     * DNA序列 由一系列核苷酸组成，缩写为 'A', 'C', 'G' 和 'T'.。
     *
     * 例如， "ACGAATTCCG" 是一个 DNA序列 。
     * 在研究 DNA 时，识别 DNA 中的重复序列非常有用。
     *
     * 给定一个表示 DNA序列 的字符串 s ，返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
     *
     * 示例 1：
     *
     * 输入：s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
     * 输出：["AAAAACCCCC","CCCCCAAAAA"]
     * 示例 2：
     *
     * 输入：s = "AAAAAAAAAAAAA"
     * 输出：["AAAAAAAAAA"]
     * 提示：
     *
     * 0 <= s.length <= 105
     * s[i]=='A'、'C'、'G' or 'T'
     * Related Topics
     * 位运算
     * 哈希表
     * 字符串
     * 滑动窗口
     * 哈希函数
     * 滚动哈希
     * @param s
     * @return
     */
    public List<String> findRepeatedDnaSequences(String s) {
        List<String> res = new ArrayList<>();
        int n = s.length();
        Map<String, Integer> map = new HashMap<>();
        for (int i = 0; i <= n - 10; i++) {
            int cnt = map.getOrDefault(s.substring(i, i + 10), 0);

            if (cnt == 1) {
                res.add(s.substring(i, i + 10));
            }
            map.put(s.substring(i, i + 10), cnt + 1);

        }
        return res;
    }





}
